机器学习聚类算法——K-means聚类

最新推荐文章于 2024-08-28 16:05:19 发布

Vic时代

最新推荐文章于 2024-08-28 16:05:19 发布

阅读量5.6k

点赞数

分类专栏：机器学习文章标签：机器学习剧烈 k均值 k-means

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/victoriaw/article/details/60141918

版权

K-means聚类是一种常见的机器学习算法，用于将数据点分组到K个簇中。该算法通过迭代更新数据点的归属和聚类中心，以最小化簇内平方误差和。从优化角度来看，它是一个迭代的爬山法过程，可能收敛于局部最优解。算法的优点包括简单快速，但对初始聚类中心的选择敏感，可能导致不同的结果或局部最优。为了避免这个问题，可以选择多样化的初始中心点。

摘要由CSDN通过智能技术生成

k均值算法

k-means聚类又称k均值聚类。
给定N个数据点 $\{\vec{x_n}\in \mathbb R^M,n=1,\cdots ,N\}$ ，M是数据点的维度。现在希望把数据点聚类成K个簇。

算法：

(1)初始化：在给定的N个样本中随机选择K个作为初始聚类中心
(2)更新划分：对每个数据点，计算其到各个聚类中心的距离，并把它归到距离最近的类
(3)更新聚类中心：计算各个类簇中数据点在每个维度上的均值，将求得的均值点作为新的聚类中心
(4)判断是否收敛：如果聚类中心的改变不超过预先设置的阈值或者损失的改变不超过设定的阈值，那么认为收敛；否则，转到步骤(2)　

从优化角度看待k均值算法

给定N个数据点 $\{\vec{x_n}\in \mathbb R^M,n=1,\cdots ,N\}$ ，M是数据点的维度。现在希望根据空间位置把数据点聚类成K个簇，使得损失函数

J (C, U) = Σ n Σ k c n k D i s t a n c e (x n \to - u k \to)

$J(C,U)=\Sigma_n\Sigma_k{c_{nk}}Distance(\vec{x_n}-\vec{u_k})$
最小。其中，聚类矩阵

C∈RN∗K $C\in\mathbb R^{N*K}$ ，(n,k)位置上的元素

最低0.47元/天解锁文章

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。